Для машинного обучения наши алгоритмы — игра

Помните, как AlphaGo ИИ система основанная на обучении с подкреплением (reinforcement learning) изобрела новую стратегию в игре Го и выиграла всех мастеров?

Группа DeepMind построили на ее основе систему AlphaDev и пробуют с ее помощью улучшать алгоритмы. Первой пала сортировка. AlphaDev получает «игровые очки» если системе удается ускорить сортировку. Путем перебора она изобрела новый алгоритм, который на коротких наборах данных быстрее на 70%, а на больших наборах на 2%.

Алгоритм уже запиливают в LLVM и пробуют оптимизировать другие алгоритмы, хеширование, например.

Коечно, это просто перебор с обратной связью, но я думаю, что тут важнее результат, а не наличие осмысленности действий. Полученный аглоритм вообще выглядит как ошибка на первый взгляд человека.

https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms

Семья 🫶 | YouTube | Twitter

Для машинного обучения наши алгоритмы — игра

Предыдущий пост

Outlook заменят на Samoware в госкомпаниях

Следующий пост

Когда ключ от сейфа в сейфе

Закрепленные

Лучшие посты

Лучшие посты 2024

🔥 Лучшие посты

Консультации и менторинг

Новым подписчикам: лучшие посты

Немного обо мне

Из подборки #AI

Главный навык разработчика в 2026 году

ChatGPT стал писать тексты… адекватно.

Последний шанс на Yandex Cup 2025

Никто не любит писать тесты

Раз в год можно и в офис съездить

— Алиса, расскажи сказку

Свежие посты

Как сделать страницу с халявой и промокодами

Встречайте геймификацию в комментах

Когда проще завайбкодить чем нагуглить

весёлая дискуссия в канале Деплой о резюме

Жизнь по скраму

не забудь завести будильник

Каникулы в регионе без интернета

Телеграмовский сосун (или какун, как правильно?)